##########################################################################################

library(data.table)
library(optparse)

##########################################################################################

option_list <- list(
    make_option(c("--info_file"), type = "character") ,
    make_option(c("--mrna_file"), type = "character") ,
    make_option(c("--out_file"), type = "character")
)

if(1!=1){
    
    info_file <- "~/20220915_gastric_multiple/dna_combinePublic/config/tumor_normal.class.MSS_MSI.list"
    mrna_file <- "~/20220915_gastric_multiple/dna_combinePublic/mRNA/NJSCC.DNAUse.53_157.tsv"
    out_file <- "~/20220915_gastric_multiple/dna_combinePublic/mRNA/NJSCC.DNAUse.48_172.tsv"

}

###########################################################################################

parseobj <- OptionParser(option_list=option_list, usage = "usage: Rscript %prog [options]")
opt <- parse_args(parseobj)
print(opt)

info_file <- opt$info_file
mrna_file <- opt$mrna_file
out_file <- opt$out_file

###########################################################################################

dat_info <- data.frame(fread( info_file ))
dat_mrna <- data.frame(fread( mrna_file ))

###########################################################################################
## 去除混合型样本
mix_sample <- unique(subset(dat_info , Type=="IM + IGC + DGC")$ID)
del_col <- which(sapply(strsplit(colnames(dat_mrna) , "_") , "[" , 1) %in% mix_sample)

dat_mrna_use <- dat_mrna[,-del_col]
colnames(dat_mrna_use) <- gsub("[.]" , "-" , colnames(dat_mrna_use))

## 现在 172 48
## 原来 198 53
write.table( dat_mrna_use , out_file , row.names = F , quote = F , sep = "\t" )